Application du coclustering à l’analyse exploratoire d’une table de données

نویسندگان

  • Aichetou Bouchareb
  • Marc Boullé
  • Fabrice Clérot
  • Fabrice Rossi
چکیده

Résumé. La classification croisée est une technique d’analyse non supervisée qui permet d’extraire la structure sous-jacente existante entre les individus et les variables d’une table de données sous forme de blocs homogènes. Cette technique se limitant aux variables de même nature, soit numériques soit catégorielles, nous proposons de l’étendre en proposant une méthodologie en deux étapes. Lors de la première étape, toutes les variables sont binarisées selon un nombre de parties choisi par l’analyste, par discrétisation en fréquences égales dans le cas numérique ou en gardant les valeurs les plus fréquentes dans le cas catégoriel. La deuxième étape consiste à utiliser une méthode de coclustering entre individus et variables binaires, conduisant à des regroupements d’individus d’une part, et de parties de variables d’autre part. Nous appliquons cette méthodologie sur plusieurs jeux de donnée en la comparant aux résultats d’une analyse par correspondances multiples ACM, appliquée aux même données binarisées.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Usage non classificatoire d'arbres de classification : enseignements d'une analyse de la participation féminine à l'emploi en Suisse

Résumé. Cet article présente une application en grandeur réelle des arbres de classification dans un contexte non classificatoire. Les arbres générés visent à mettre en lumière les différences régionales dans la façon dont les femmes décident de leur participation au marché du travail. L’accent est donc mis sur la capacité descriptive plutôt que prédictive des arbres. L’application porte sur de...

متن کامل

Investigation visuelle d'événements dans un grand flot de liens

Résumé. Nous présentons une nouvelle méthode d’analyse exploratoire de grands flots de liens que nous appliquons à la détection d’événements significatifs dans plus de 2 millions d’interactions (pendant 4 mois) entre utilisateurs du réseau social en ligne Github. Nous combinons une méthode statistique de détection automatique d’événements dans une série temporelle, Outskewer, avec un système de...

متن کامل

Construction de descripteurs à partir du coclustering pour la classification supervisée de séries temporelles

Résumé. Nous présentons un processus de construction de descripteurs pour la classification supervisée de séries temporelles. Ce processus est libre de tout paramétrage utilisateur et se décompose en trois étapes : (i) à partir des données originales, nous générons de multiples nouvelles représentations simples ; (ii) sur chacune de ces représentations, nous appliquons un algorithme de cocluste...

متن کامل

L'influence du mysticisme islamique sur l'éducation iranienne

Il faut savoir que le mysticisme a eu toujours de grandes influences sur tout ce qui concerne la vie et la culture iraniennes, surtout sur l’éducation qui est une étape très importante dans la formation de l’avenir de la jeunesse. C’est vrai, le mysticisme est une approche individualiste alors que l’éducation reste une affaire collective et sociale. Comment arrive-t-il, étant une pratique perso...

متن کامل

Construction et analyse de résumés de données évolutives : application aux données d'usage du Web

Résumé. La manière dont une visite est réalisée sur un site Web peut changer en raison de modifications liées à la structure et au contenu du site lui-même, ou bien en raison du changement de comportement de certains groupes d’utilisateurs ou de l’émergence de nouveaux comportements. Ainsi, les modèles associés à ces comportements dans la fouille d’usage du Web doivent être mis à jour continuel...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2017